Extraction de zones informatives dans des images de formulaire en couleur
نویسندگان
چکیده
RÉSUMÉ. Nous présentons, dans cet article, une approche permettant de localiser des zones informatives dans des documents couleur, par extraction de zones rectangulaires de couleur homogène. L’objectif de ce travail est d’obtenir des ancres pour le répérage et l’extraction d’information textuelle. L’approche proposée repose sur trois étapes. La première consiste à procéder à un filtrage de bruit, tout en évitant de créer de nouvelles couleurs ou de causer des distortions des contours. Ensuite, une quantificiation de couleur est réalisée, en combinant des plans de différents espaces couleurs, pour détecter les régions homogènes dans une image. Enfin, nous détectons les composantes connexes répondant à un critère de rectangularité. L’approche est évaluée sur 134 images de document, avec des métriques de la littérature. Nous montrons dans les résultats l’importance du choix des plans de couleur utilisés.
منابع مشابه
Extraction d'objets vidéo : une approche combinant les contours actifs et le flot optique
Résumé. Dans cet article, nous présentons une méthode mixte de segmentation d'objets visuels dans une séquence d'images d'une vidéo combinant à la fois une segmentation basée régions et l'estimation de mouvement par flot optique. L'approche développée est basé sur une minimisation d'une fonctionnelle d'énergie (E) qui fait intervenir les probabilités d'appartenance (densité) avec une gaussienne...
متن کاملNouvelle formulation du modèle de Kubelka et Munk avec application aux encres fluorescentes
Parmi les modèles de prédiction couleur courants, celui de Kubelka et Munk occupe une position centrale. En dépit de son caractère phénoménologique et de sa simplicité, il conduit à des résultats intéressants, et est toujours employé dans les systèmes d’aide à la formulation d’encres, de peintures et de teintures. Après un bref rappel du modèle, une nouvelle formulation mathématique basée sur u...
متن کاملArchitecture des bases d'Images Généralistes Organisées en Clusters
Résumer. Les développements actuels, en matière de technologie liée à l’information numérique, ont permis l’acquisition et le stockage d’une quantité importante d’information, ce qui a engendré la nécessité d'élaborer des systèmes permettant la gestion de ces données (plus particulièrement les bases de données images). La recherche d’images par le contenu tente de répondre à ces besoins en se b...
متن کاملSegmentation d’images couleur
La segmentation consiste à partitionner l’image en régions disjointes avec des couleurs homogènes. Les méthodes de segmentation d’images couleur peuvent être divisées en deux familles, selon qu’elles analysent la distribution des couleurs des pixels dans le plan image ou dans un espace couleur. La première partie de cet exposé ne décrira pas toutes les méthodes de segmentation existantes, mais ...
متن کاملCorrection de formulaires basée sur des machines pondérées à états finis Correction de formulaires basée sur des machines pondérées à états finis
Résumé : Pour être rendue plus démocratique, surtout dans les applications industrielles, la reconnaissance de caractères manuscrits a besoin d’atteindre de très hauts taux de reconnaissance. Pour cela, une correction dédiée à un problème particulier le permet de manière efficace, en modélisant l’information a priori disponible. Dans ce papier, nous présentons une méthode complète de compréhens...
متن کامل